期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于局部平滑性的通用增量流形学习算法
周雪燕 韩建敏 詹宇斌
计算机应用    2012, 32 (06): 1670-1673.   DOI: 10.3724/SP.J.1087.2012.01670
摘要851)      PDF (711KB)(417)    收藏
目前大多数流形学习算法无法获取高维输入空间到低维嵌入空间的映射,无法处理新增数据,因此无增量学习能力。而已有的增量流形学习算法大多是通过扩展某一特定的流形学习算法使其具备增量学习能力,不具有通用性。针对这一问题,提出了一种通用的增量流形学习(GIML)算法。该方法充分考虑流形的局部平滑性这一本质特征,利用局部主成分分析法来提取数据集的局部平滑结构,并寻找包含新增样本点的局部平滑结构到对应训练数据的低维嵌入坐标的最佳变换。最后GIML算法利用该变换计算新增样本点的低维嵌入坐标。在人工数据集和实际图像数据集上进行了系统而广泛的比较实验,实验结果表明GIML算法是一种高效通用的增量流形学习方法,且相比当前主要的增量算法,能更精确地获取增量数据的低维嵌入坐标。
相关文章 | 多维度评价
2. 流形上的非线性判别K均值聚类
高丽平 周雪燕 詹宇斌
计算机应用    2011, 31 (12): 3247-3251.  
摘要1045)      PDF (921KB)(530)    收藏
为提高具有流形结构的高维数据的聚类性能,提出非线性判别K均值聚类算法(NDisKmeans)。该方法通过引入流形上的谱正则化技术,将数据的低维嵌入表示成数据流形上平滑函数的线性组合,然后通过最大化低维空间中聚类类间的散度与总体散度的比值,来实现对高维数据的聚类。还设计了一种收敛的迭代求解方法来求解最优组合系数矩阵和聚类赋值矩阵。NDisKmeans方法由于考虑了数据的流形结构,克服了判别K均值算法中线性映射的不足,从而提高了对高维数据聚类的性能。最后在数据集上的广泛实验表明,NDisKmeans方法能有效实现对高维数据的聚类。
相关文章 | 多维度评价
3. 一种基于有向树挖掘Web日志中最大频繁访问模式的方法
詹宇斌 殷建平 张玲 龙军 程杰仁
计算机应用   
摘要1602)      PDF (810KB)(982)    收藏
提出了一种基于Apriori思想的挖掘最大频繁访问模式的sTree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问模式;使用频繁模式树连接分层的频繁弧克服了图结构数据挖掘算法中直接连接两个频繁模式树要判断连接条件的缺点,同时采用预剪枝策略,降低了算法的开销。实验表明,sTree算法具有可扩展性,运行效率比直接采用图结构数据挖掘算法要高。
相关文章 | 多维度评价